dados = read_csv(here("data/series_from_imdb.csv"), 
                    progress = FALSE,
                    col_types = cols(.default = col_double(), 
                                     series_name = col_character(), 
                                     episode = col_character(), 
                                     url = col_character(),
                                     season = col_character()))

1. A má avaliação de uma temporada implica no cancelamento da série?

Para responder essa pergunta irei selecionar as 4 primeiras temporadas das 6 séries que foram canceladas para tomar como dado base, e analisar o desenvolvimento das suas avaliações médias por temporada.

dados$season <- as.integer(dados$season)
sumarios = dados %>% 
      filter(series_name %in% c("2 Broke Girls","Sense8", "The Killing", "House of Cards","Heroes","Under The Dome"))%>%
    filter(season<=4) %>%
    group_by(series_name,season) %>% 
    summarise(
        season_rating = round(mean(user_rating),2))

p <- ggplot(data = sumarios, aes(x = season,y=season_rating, fill = series_name)) +
            geom_bar(stat = "identity",position = "dodge")
ggplotly(p)
## We recommend that you use the dev version of ggplot2 with `ggplotly()`
## Install it with: `devtools::install_github('hadley/ggplot2')`

Usando um gráfico de barras interativo, o qual representa a avalição média por temporada de cada série cancelada. É visualizado que não existe um padrão de má avaliação como motivo de cancelamento da série. Séries como Under The Dome, 2 Broke Girls, e Heroes, tiveram um decaimento na sua avalição média, por outro lado, séries como The Killing, Sense8 e House of Cards tiveram boas e crescentes avaliações, mesmo assim foram canceladas. Logo, apenas a má avaliação de uma temporada não implica no cancelamento da série, existem outros fatores que podem infligir no cancelamento da série, como alto orçamento(No caso de sense8), polêmica com o protagonista(House of Cards), ou falta de audiência no caso de The Killing.

2. Observando os dados da questão 1, é possível afirmar que existiu um constante decaímento na audiência nas séries que tiveram constante uma baixa na avaliação média?

Para responder essa pergunta irei analisar a quantidade de votos das séries que tiveram uma queda na avaliação média com o decorrer das temporadas: Under The Dome, Heroes.

sumarios = dados %>% 
      filter(series_name %in% c("Heroes","Under The Dome"))%>%
    group_by(series_name,season) %>% 
    summarise(
        season_rating = round(mean(user_rating),2),
        season_votes = round(mean(user_votes),2))
    sumarios$season <- as.integer(sumarios$season)
heroes = sumarios%>%
    filter(series_name %in% c("Heroes"))
p1 <- plot_ly(sumarios, x = ~heroes$season, y = ~heroes$season_rating, 
        mode = "markers", color = heroes$season_votes, size = heroes$season_votes, marker=list(sizeref=0.1)) %>%
  layout(
    title = 'Heroes',
    xaxis = list(
      title = 'Temporada',
      range = c(0,5)
    ),
    yaxis = list(
      title = 'Avaliação média'
    )%>% colorbar(title = "Quantidade de votos")
  )
## Warning: 'layout' objects don't have these attributes: 'aaxis', 'baxis', 'caxis'
## Valid attributes include:
## 'font', 'title', 'titlefont', 'autosize', 'width', 'height', 'margin', 'paper_bgcolor', 'plot_bgcolor', 'separators', 'hidesources', 'smith', 'showlegend', 'xaxis', 'yaxis', 'ternary', 'scene', 'geo', 'mapbox', 'radialaxis', 'angularaxis', 'direction', 'orientation', 'dragmode', 'hovermode', 'hoverlabel', 'legend', 'annotations', 'shapes', 'images', 'updatemenus', 'sliders', 'calendar', 'barmode', 'bargap', 'mapType'
## Warning: Didn't find a colorbar to modify.
under = sumarios%>%
    filter(series_name %in% c("Under The Dome"))
p2 <- plot_ly(sumarios, x = ~under$season, y = ~under$season_rating, 
        mode = "markers", color = under$season_votes, size = under$season_votes, marker=list(sizeref=0.1)) %>%
  layout(
    title = 'Under the Dome',
    xaxis = list(
      title = 'Temporada',
      range = c(0,5)
    ),
    yaxis = list(
      title = 'Avaliação média'
    )
  )%>% colorbar(title = "Quantidade de votos")
## No trace type specified:
##   Based on info supplied, a 'scatter' trace seems appropriate.
##   Read more about this trace type -> https://plot.ly/r/reference/#scatter
ggplotly(p1)
## No trace type specified:
##   Based on info supplied, a 'scatter' trace seems appropriate.
##   Read more about this trace type -> https://plot.ly/r/reference/#scatter
ggplotly(p2)

Utilizando 2 gráficos interativos, é possivel perceber que enquanto a avaliação média sofre um decaimento, a quantidade de votos cai da mesma forma, existindo assim uma associação entre avaliação média, quantidade de votos e o cancelamento dessas 2 séries.